import java.util.*;

/**
 * 给定一个段落 (paragraph) 和一个禁用单词列表 (banned)。返回出现次数最多，同时不在禁用列表中的单词。
 * 题目保证至少有一个词不在禁用列表中，而且答案唯一。
 * 禁用列表中的单词用小写字母表示，不含标点符号。段落中的单词不区分大小写。答案都是小写字母。
 *
 * 示例：
 * 输入: 
 * paragraph = "Bob hit a ball, the hit BALL flew far after it was hit."
 * banned = ["hit"]
 * 输出: "ball"
 * 解释: 
 * "hit" 出现了3次，但它是一个禁用的单词。
 * "ball" 出现了2次 (同时没有其他单词出现2次)，所以它是段落里出现次数最多的，且不在禁用列表中的单词。 
 * 注意，所有这些单词在段落里不区分大小写，标点符号需要忽略（即使是紧挨着单词也忽略， 比如 "ball,"）， 
 * "hit"不是最终的答案，虽然它出现次数更多，但它在禁用单词列表中。
 *
 * 提示：
 * 1 <= 段落长度 <= 1000
 * 0 <= 禁用单词个数 <= 100
 * 1 <= 禁用单词长度 <= 10
 * 答案是唯一的, 且都是小写字母 (即使在 paragraph 里是大写的，即使是一些特定的名词，答案都是小写的。)
 * paragraph 只包含字母、空格和下列标点符号!?',;.
 * 不存在没有连字符或者带有连字符的单词。
 * 单词里只包含字母，不会出现省略号或者其他标点符号。
 *
 * 来源：力扣（LeetCode）
 * 链接：https://leetcode-cn.com/problems/most-common-word
 * 著作权归领扣网络所有。商业转载请联系官方授权，非商业转载请注明出处。
 */
public class Q00819s {
    public String mostCommonWord(String paragraph, String[] banned) {
        Map<String, Integer> map = new HashMap<>();
        Set<String> bans = new HashSet<>(Arrays.asList(banned)); // 用作去重
        String ans = null;
        int i = 0, j = 0, maxCount = 0;
        boolean flag = false; // 是否在处理单词
        for (; i < paragraph.length(); i++) {
            if (!Character.isLetter(paragraph.charAt(i))) { // 符号或空格
                if (flag) { // 需要处理这一段单词
                    String s = paragraph.substring(j, i).toLowerCase();
                    if (!bans.contains(s)) {
                        if (map.merge(s, 1, Integer::sum) > maxCount) {
                            maxCount++;
                            ans = s;
                        }
                    }
                }
                flag = false; // 被符号中断
            } else if (!flag) { // 切换为开始处理单词
                j = i;
                flag = true;
            }
        }
        if (flag) { // 结尾是单词
            String s = paragraph.substring(j, i).toLowerCase();
            if (!bans.contains(s) && map.getOrDefault(s, 0) == maxCount) {
                return s;
            }
        }
        return ans;
    }
}
